یک الگوریتم خوشه بندی مشارکتی گرانشی جدید برای خوشه بندی مستندات وب

پایان نامه
چکیده

خوشه بندی داده، روشی برای تحلیل داده هاست که حجم بزرگی از داده ها را در گروه های معناداری از موضوعات به نام خوشه خلاصه می کند به نحوی که داده های موجود در هر خوشه، دارای حداکثر میزان شباهت به یکدیگر بر اساس یک معیار شباهت هستند و داده های موجود در خوشه های مختلف دارای حداکثر میزان اختلاف از یکدیگرند. خوشه بندی در بسیاری از کاربردها از جمله بیوانفورماتیک، بازشناسی الگو، پردازش تصویر، داده کاوی و متن کاوی کاربرد دارد. تاکنون روشهای بسیاری برای خوشه بندی ارائه شده که دارای تعاریف مختلفی برای خوشه ها، متدلوژی خوشه بندی و معیارهای شباهت هستند. بدیهی است که هیچ یک از روشهای خوشه بندی نمی تواند برای انواع ساختارهای داده ای مورد استفاده قرار گیرد. ترکیب چند راه حل به دست آمده در خوشه بندی، می تواند منجر به ارتقای کیفیت نتیجه ی به دست آمده از الگوریتم های پایه شود. در این پایان نامه، یک روش جدید برای ترکیب نتایج چند الگوریتم خوشه بندی بر مبنای تئوری گرانش، ارائه شده است که خوشه بندی مشارکتی گرانشی نام دارد. با توجه به رشد نمایی حجم اطلاعات و مستندات در فضای وب، ارائه ی راهکارهایی جهت دسته-بندی مطلوب داده ها، حائز اهمیت است تا از این طریق پردازش اطلاعات موجود در مستندات وب، آسان شود. بنابراین خوشه بندی مستندات وب در این پایان نامه مورد توجه قرار گرفته و الگوریتم پیشنهادی برای خوشه بندی مستندات وب به کار رفته است. الگوریتم پیشنهادی، با استفاده از معیارهای کیفیت خوشه بندی مورد ارزیابی قرار گرفته و با چند روش معروف در خوشه بندی ترکیبی مقایسه شده است. نتایج آزمایش ها نشان می دهد که روش پیشنهادی قادر است در ترکیب چند راه حل حاصل از الگوریتم های خوشه بندی با کیفیت بالایی عمل کند. روش پیشنهادی، در مقایسه با سایر روش های ترکیب خوشه بندی دارای پیچیدگی محاسباتی کمتری است و قادر است خوشه هایی با ساختار پیچیده را استخراج کند که این دو ویژگی در اغلب الگوریتم های خوشه بندی به صورت همزمان یافت نمی شود.

منابع مشابه

ارایه شاخصی جدید جهت سنجش اعتبار خوشه بندی در الگوریتم های خوشه بندی فازی نوع-2

One of the main issues in fuzzy clustering is to determine the number of clusters that should be available before clustering and selection of different values for the number of clusters will lead to different results. Then, different clusters obtained from different number of clusters should be validated with an index. But so far such an index has not been introduced for interval type-2 fuzzy C...

متن کامل

یک روش ترکیبی خوشه بندی مبتنی بر الگوریتم ژنتیک با استفاده از عملگر های جدید تغییر

  The clustering problem under the criterion of minimum sum of squares is a non-convex and non-linear program, which possesses many locally optimal values, resulting that its solution often being stuck at locally optimal values and therefore cannot converge to global optima solution. In this paper, we introduce several new variation operators for the proposed hybrid genetic algorithm for the cl...

متن کامل

الگوریتمی جدید برای جزیره بندی کنترل شده سیستم های قدرت مبتنی بر خوشه بندی طیفی مقید

In this paper a new algorithm is presented for power systems controlled islanding based on constrained spectral clustering. The proposed algorithm minimizes two objective functions of power flow disruption in transmission lines and generation - demand imbalance in islands to ensure transient stability within islands and to minimize necessary actions in reconfiguration of transmission system, ge...

متن کامل

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...

متن کامل

خوشه بندی و رتبه بندی پیمانکاران با استفاده از مدل های خوشه بندی و ویکور (مطالعه موردی: مسکن مهر شهر جدید هشتگرد)

 مدیریت بر اجرای طرح های مسکن مهر که نیازمند سرعت عمل بسیار زیاد و در حجم گسترده است تنها با دریافت و پردازش صحیح و به موقع داده ها و اطلاعات قابل اعتماد محقق خواهد شد. برنامه ریزی های بلند مدت مدیران در تمامی سطوح پروژه های مسکن مهر که مسیر حرکت و نحوه ی عملکرد کلیه ی دست اندرکاران طرح مسکن مهر را تعیین می کند بر مبنای تحلیل داده های موجود انجام می شود. شرکت عمران شهر جدید هشتگرد به عنوان یکی ...

متن کامل

بررسی مشکلات الگوریتم خوشه بندی DBSCAN و مروری بر بهبودهای ارائه‌شده برای آن

Clustering is an important knowledge discovery technique in the database. Density-based clustering algorithms are one of the main methods for clustering in data mining. These algorithms have some special features including being independent from the shape of the clusters, highly understandable and ease of use. DBSCAN is a base algorithm for density-based clustering algorithms. DBSCAN is able to...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023